06. 注意力概述

真假判断:序列到序列模型会在一个时间步处理整个输入序列

SOLUTION: 假 - 序列到序列模型的原理是一次将输入序列的一个元素输送到编码器中

使用注意力方法可以解决下面的哪个序列到序列模型不足之处?

SOLUTION:
  • 从编码器传递到解码器的语境矩阵的大小是固定的,这是个瓶颈问题
  • 难以对长的序列进行编码并难以回忆长期依赖项

注意力序列到序列模型中的语境矩阵有多长?

SOLUTION: 取决于输入序列的长度